树是一种非顺序数据结构,它用于存储需要快速查找的数据非常有用。
树是一种分层数据的抽象模型。现实中最常见的例子是家谱,或是公司的组织架构:
树的相关术语
一个树结构包含一系列存在父子关系的节点。每个节点都有一个父节点(除了顶部的第一个节点)以及零个或多个子节点:
- 节点:树中的每个元素都叫做节点,节点分为内部节点和外部节点。
- 根节点:位于树顶部的节点,它没有父节点
- 内部节点:至少有一个子节点的节点(7、5、9、15、13、20是内部节点)
- 外部节点:没有子元素的节点称为外部节点或叶节点(3、6、8、10、12、14、18、25是叶节点)
有关树的另一个术语是子树。子树由节点和它的后代构成。例如,节点13、12、14构成了上图中树的一棵子树。
节点的一个属性是深度,节点的深度取决于它的祖先节点的数量。比如,节点3有3个祖先节点,它的深度为3。
树的高度取决于所有节点深度的最大值。
二叉树和二叉搜索树
二叉树中的节点最多只能有两个子节点:一个是左侧子节点,另一个是右侧子节点。
二叉搜索树是二叉树的一种,但是它只允许你在左侧节点存储(比父节点)小的值,在右侧节点存储(比父节点)大(或者等于)的值。
创建二叉搜索树
1 | function BinarySearchTree(){ |
下图展现了二叉搜索树数据结构的组织方式:
声明一个Node
类来表示树中的每个节点,不同于之前将节点本身称作节点或项,在这里我们称作键,键是树相关的术语中对节点的称呼。
然后,我们需要实现一些方法:
insert(key):
向树中插入一个新的键;search(key):
在树中查找一个键,如果节点存在,则返回true
;如果不存在,则返回false
;inOrderTraverse:
通过中序遍历方式遍历所有节点。preOrderTraverse:
通过先序遍历方式遍历所有节点。postOrderTraverse:
通过后序遍历方式遍历所有节点。min:
返回树中最小的值/键。max:
返回树中最大的值/键。remove(key):
从树中移除某个键。
向树中插入一个键
下面的代码是用来向树插入一个新键的算法的第一部分:
1 | this.insert = function(key){ |
以上情况还需要一个私有的辅助函数:
1 | var insertNode = function(node, newNode){ |
树的遍历
遍历一棵树是指访问树的每个节点并对它们进行某种操作的过程。访问树的所有节点有三种方式:中序、先序、后序。
中序遍历
中序遍历是一种上行访问BST所有节点的遍历方式,也就是从最小到最大的顺序访问所有节点。中序遍历的一种应用就是对树进行排序操作。
以下是它的实现:
1 | this.inOrderTraverse = function(callback){ |
inOrderTraverse
方法接收一个回调函数作为参数。回调函数用来定义我们对遍历到的每个节点进行操作。由于我们在BST中最常实现的算法是递归,这里使用了一个私有的辅助函数,来接收一个节点和对应的回调函数作为参数:
1 | var inOrderTraverseNode(node, callback){ |
下面的图描绘了inOrderTraverse方法的访问路径:
先序遍历
先序遍历是以优先于后代节点的顺序访问每个节点的。先序遍历的一种应用是打印一个结构化的文档。
1 | this.preOrderTraverse = function(callback){ |
preOrderTraverseNode
方法的实现如下:
1 | var preOrderTraverseNode(root, callback){ |
先序遍历和中序遍历的不同点是,先序遍历会先访问节点本身,然后在访问它的左侧子节点,最后是右侧子节点,下图描绘了preOrderReverse
方法的访问路径:
后序遍历
后序遍历则是先访问节点的后代节点,再访问节点本身。后序遍历的一种应用是计算一个目录和它的子目录中所有文件所占用空间的大小。
1 | this.postOrderTraverse = function(callback){ |
postOrderTraverseNode
方法的实现如下:
1 | var postOrderTraverseNode = function(node, callback){ |
下面的图描绘了postOrderTraverseNode
方法的访问路径:
搜索树中的值
在树中,有三种经常执行的搜索类型:
- 最小值;
- 最大值;
- 搜索特定的值。
搜索最大值和最小值
很容易看出,这棵树中的最小值在最后一层最左侧的节点,最大值在最右端的节点。
首先,我们来看寻找树的最小键的方法:
1 | this.min = function(){ |
min
方法将暴露给用户。这个方法调用了minNode
方法:
1 | var minNode = function(Node){ |
以相似的方法,可以实现max
方法:
1 | this.max = function(){ |
搜索一个特定的值
实现函数如下:
1 | this.search = function(key){ |
移除一个节点
BST的最后一个方法,也是最难复杂的方法,就是remove
,我们先创建这个方法,使它能够在树的实例上被调用:
1 | this.remove = function(key){ |
removeNode
方法的复杂之处在于我们要处理不同的运行场景,当然也包括它同样是通过递归来实现的:
1 | var removeNode = function(node, key){ |
我们来分析一下第三种情况,也是最复杂的情况,那就是要移除的节点有两个子节点——左侧子节点和右侧子节点,需要执行四个步骤:
- 当找到了需要移除的节点后,需要找到它右边子树中最小的节点(它的继承者)。
- 然后,用它右侧子树中最小节点的键去更新这个节点的值。通过这一步,我们改变了这个节点的键,也就是说它被移除了。
- 但是,这样在树中就有两个拥有相同键的节点了,这是不行的。要继续把右侧子树中的最小节点移除,毕竟它已经被移至要移除的节点的位置了。
- 最后,向它的父节点返回更新后节点的引用。
下图展示了这个过程:
下面是完整的代码:
1 | function BinarySearchTree() { |